import requests
import re

url = "https://gitee.com/"
headers = {
    'User-Agent': 'Mozilla/5.0'
}

# 发送GET请求并获取响应内容
resp = requests.get(url, headers=headers).content.decode('utf-8')
# print(resp)

# -------------------------------------------------------------------
# 使用正则表达式提取<meta name="description" ...>中的内容
pattern = r'<meta\s+name="description"\s+content="(.*?)"\s*/?>'

# findall 返回一个列表，包含所有匹配结果
descriptions = re.findall(pattern, resp, re.IGNORECASE)

# 判断是否提取成功
if descriptions:
    print("Gitee 网站介绍信息：")
    print(descriptions[0])  # 因为这里只有一个 description，所以取第一个
else:
    print("未找到网站介绍信息。")

# -------------------------------------------------------------------
# 拓展：同时抓取 keywords 和 description
for meta_name in ["description", "keywords"]:
    pattern = fr'<meta\s+name="{meta_name}"\s+content="(.*?)"\s*/?>'
    result = re.findall(pattern, resp, re.IGNORECASE)
    if result:
        print(f"{meta_name}:", result[0])


